美国德州引入AI改卷 教育工作者忧写作表达方式受限 学生随时考0分
德州教育局(TEA)引入的「自动评分引擎」主要针对评改 STAAR 考试中的开放式问题答案,系统能支援聊天机械人,如 ChatGPT 去了解用户并与其沟通。
在修改了2023年的 STAAR 考试后,当局减少了多选题的数量,并将开放式问题增加了6至7倍。 德州教育局的学生评估主任 Jose Rios 表示,我们希望保留尽可能多的开放式问题,但是这需要大量的时间来评分。
一些德州各地的教育工作者对当局决定使用 AI 改卷,感到意外。 其中一个原因是 STAAR 考试对校园和学区十分重要,家长和老师质疑 AI 评分的能力,认为比不上人工评分员,对此感到不安。 他们忧虑学生在写作中展现自己的看法和独创性而无法得分。
独立学区负责人 Lori Rapp 指,去年12月,仍在有限度地使用自动评分系统时,校区被评为0分的答案急剧增加。 可是,他认为仍无法确定是用以测试的问题还是系统出错。
为了开发评分系统,TEA 收集了3,000份经过两轮人工评分的答卷,进行训练。 在今年春季,正式使用系统时亦会推行安全措施,系统先为所有开放式问题进行评分,之后四分之一的回应再由人工评分员重新批改,包括一些有机会令AI 混淆的答案,如 包含非英文和俚语。
TEA预计,「自动评分引擎」将带来强大的经济效益。 由于系统能取代大量人类评卷员,相较去年的6,000人,今年只聘请了2,000人,故估计每年可节省1,500至2,000万美元(约1.2亿至1.6亿港元)。